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视觉 表象 生成 系统 及 其 影响 因素 
HE KER A t 


(华南 师范 大 学 心理 学 院 , 广州 510631) 


摘 要 视觉 表象 是 在 记忆 基础 上 产生 的 类 似 知 觉 的 信息 表征 ,也 是 人 们 在 日 常生 活 中 不 可 或 缺 的 心理 活动 
之 一 。 本 综述 介绍 了 该 领域 中 比较 有 影响 力 的 表象 计算 理论 模型 ， 并 进一步 归纳 了 视觉 表象 生成 系统 的 成 分 
及 其 对 应 的 神经 基础 。 分 析 结 果 强 调 了 初级 视觉 皮层 作为 “视觉 缓冲 器 "是 生成 表象 的 主要 机 能 结构 ， 以 “视觉 
缓冲 器 ?为 基础 的 表象 生成 系统 的 机 能 受 多 重 因 素 影响 。 本 综述 有 助 于 对 视觉 表 象 生成 系统 形成 全 面 的 认识 ， 
促进 视觉 表象 实质 的 进一步 研究 。 
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表象 mental imagery), JRA CŽ, AIGA ARN RA W FAM RR ME HE ETT BY 
物 不 在 面前 出 现时 ， 人 们 在 头脑 中 形成 的 关于 事 证 据 ， 在 很 大 程度 上 终结 了 “表象 之 争 ”(Pearson 
物 的 形象 (Kosslyn, Ganis, & Thompson, 2001)。 视 & Kosslyn, 2015)。 目前 ,表象 研究 已 经 进入 了 “后 
觉 表 象 以 感知 觉 为 基础 ， 又 是 感知 觉 的 延伸 ， 它 表象 之 争 ” 时 代 ， 研 究 者 们 不 再 争论 表象 表征 格 
被 认为 是 弱化 的 “知觉 ”(Pearson, Naselaris, Holmes, 式 的 问题 ,而 是 将 注意 力 重 新 转移 到 表象 的 实质 
& Kosslyn，2015)。20 世纪 60 年 代 以 来 ， KRK 与 功能 上 来 。 在 这 一 背景 下 ,我 们 重新 对 视觉 表 
征 的 格式 问题 受到 广泛 的 关注 ， 以 Pylyshyn 为 代 象 的 生成 及 其 神经 机 制 问 题 进行 归纳 总 结 具 有 重 
表 的 一 部 分 学 者 认为 表象 是 命题 表征 (propositional 要 的 意义 。 众 所 周知 ,视觉 表 象 的 生成 和 操作 是 
representations) (Pylyshyn, 2002); 而 以 Kosslyn 为 视觉 表象 加 工 过 程 的 两 个 重要 成 分 并且 后 者 是 
代表 的 另 一 部 分 学 者 则 认为 表象 是 一 种 类 似 知觉 建立 在 前 者 的 基础 之 上 。 因 此 ， 了 解 视觉 表象 生 
的 图 画 式 信息 表征 (depictive representations) (Kosslyn, 成 的 过 程 是 探讨 视觉 表象 实质 的 关键 。 鉴 于 此 ， 
Behrmann, & Jeannerod，1995)， 两 者 之 间 的 分 歧 本 文 在 系统 梳理 视觉 表象 相关 研究 文献 的 基础 上 ， 
被 称 为 “表象 之 争 (imagery debate)” (Bartolomeo, 描述 视觉 表象 的 生成 系统 并 分 析 影 响 视觉 表象 生 
2002)。 随 着 科学 技术 的 不 断 进步 , PET. fMRI 等 成 系统 的 各 种 因素 , 试图 全 面 刻画 表象 生成 这 一 
脑 成 像 技 术 的 发 展 为 探讨 表象 实质 提供 了 客观 指 基本 的 认 知 过 程 。 
标 ， 也 为 解决 “表象 之 争 ” 提 供 了 新 的 思路 和 方法 。 
Naselaris, Olman, Stansbury, Ugurbil 和 Gallant l 视觉 表象 生成 系统 的 基本 介绍 
(2015) 构 建 了 一 个 基于 体 素 的 Gabor 编码 模型 ， 1.1 表象 计算 理论 (computational theory) 
证 实 视觉 表象 过 程 中 初级 视觉 皮层 (V1 区 ) 能 够 表 Kosslyn (1980) 的 表象 计算 理论 (computational 
征 具体 的 底层 视觉 特征 信息 (如 方向 、 空 间 频 率 等 )， theory) 是 最 具有 代表 性 的 表象 理论 ， 它 通过 建构 
并 且 这 些 描绘 性 的 视觉 特征 可 以 解码 心理 表象 ， 计算 机 模拟 模型 ， 对 视觉 表象 的 生成 过 程 进行 较 
为 系统 全 面 的 阐述 。 
表象 计算 理论 提出 ,表象 生成 系统 是 以 代码 
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representation) 和 深层 表征 (deep representation) 。 表 
层 表 征 又 称 为 类 图 像 表 征 (quasi-picture)， 即 信息 
以 图 画 表征 的 形式 保存 在 短 时 记忆 中 , 保留 了 与 
位 置 、 方 向 信息 有 关 的 空间 属性 ; 而 深层 表征 与 
长 时 记忆 相关 ， 又 分 为 本 义 表征 (literal representation) 
和 命题 表征 (propositional representation)。 本 义 表 
征 所 提供 的 是 关于 某 一 客体 基本 形状 的 框架 ， 它 
是 以 坐标 表 的 形式 存储 在 计算 机 模型 中 ,指明 客 
体 各 点 在 视觉 短 时 记忆 中 的 位 置 。 本 义 表 征 需 放 
置 在 视觉 缓冲 器 中 ,重新 模拟 构建 图 像 的 空间 信 
息 。 命 题 表 征 则 是 由 抽象 的 命题 表 构 成 的 ， 它 是 
描述 性 的 信息 ， 可 以 用 来 描述 物体 的 各 种 特征 以 
及 这 些 特征 与 它 的 基础 框架 之 间 的 关系 ， 比 如 当 
个 体 在 大 脑 中 描述 一 辆 车 时 , 包括 了 前 后 轮 、 方 
向 盘 、 保 险 杆 等 具体 特征 和 相对 位 置 。 

基于 表象 的 两 种 表征 形式 , Kosslyn 回顾 并 归 
纳 了 与 表象 生成 相关 的 三 类 实证 研究 : (1) 在 一 系 
列 的 实验 中 ， 研 究 人 员 发 现 随 着 表征 客体 附加 成 
分 的 增多 ,生成 表象 的 时 间 也 成 比例 地 增加 ， 这 
说 明 多 个 局 部 图 像 不 能 一 次 性 被 检索 ， 而 是 以 独 
立 的 编码 方式 存储 (Beech & Allport, 1978; Paivio, 
1975a); (2) 人 们 可 以 通过 描绘 的 方式 在 头脑 中 引 
导 局 部 图 像 的 放置 并 构建 表象 ; (3) Farah 和 
Kosslyn (1981) 和 Hayes (1973) 的 研究 都 表明 人 们 
可 以 形成 不 同 “ 主 观 尺 寸 " 的 表象 ,但 难 易 程度 不 
同 。 对 同一 个 物体 , 个 体 将 之 想象 成 较 小 的 尺寸 
比 将 之 想象 成 较 大 的 尺寸 所 花费 的 时 间 更 少 ,说 
明 被 试 在 大 脑 中 形成 较 小 尺寸 的 图 像 时 ， 由 于 资 
源 限制 ， 删 减 了 一 些 关 于 物体 的 细节 。 根 据 这 些 
实证 结果 , Kosslyn 认为 在 表象 生成 过 程 中 存在 着 
三 个 主要 的 加 工 模块 或 者 过 程 (如 图 1 所 示 ):“ 图 
示 ” 处 理 模 块 (PICTURE processing module)， 当 被 
试 表征 由 多 个 局 部 图 像 组 成 并 且 每 个 部 分 都 是 独 
立 编码 的 图 像 的 时 候 ， 该 模块 可 以 对 存储 在 长 时 
记忆 中 的 物体 或 者 场景 的 抽象 信息 进行 编码 ， 以 
此 将 深层 表征 转化 为 短 时 记忆 中 的 表层 表征 ， 因 
此 表象 生成 时 间 会 随 着 物体 或 者 场景 的 复杂 程度 
增加 而 增加 ;“ 放 置 * 处 理 模块 (PUT processing 
module), 考虑 到 人 们 可 以 使 用 描绘 的 方式 将 独立 
存储 的 编码 信息 整合 为 一 个 单一 的 成 像 场 景 ， 
Kosslyn 认为 大 脑 中 存在 一 个 “放置 "处 理 模块 ， 将 
客体 的 每 个 部 分 放置 于 正确 的 位 置 。 该 模块 不 是 
简单 地 摆 放 每 个 部 分 ， 而 是 根据 局 部 (比如 ， 汽 车 


i- 一 -二 放置 处 理 模块 K- -=-， 


图 示 处 理 模块 


图 1 视觉 表象 的 计算 理论 模型 
注 :“ 图 示 ” 处 理 模块 负责 激活 储存 在 长 时 记忆 中 的 视觉 信 
息 ;“ 放 置 " 处 理 模 块 负责 解释 局 部 图 像 是 如 何 整合 的 ;“ 发 
现 ” 处 理 模块 负责 定位 基础 特征 ; 三 者 既 可 相互 合作 又 可 
彼此 独立 地 参与 表象 生成 过 程 。 


的 轮子 ) 与 局 部 (比如 ,汽车 的 车 门 ) 之 间 的 相对 位 
置 或 者 距离 进行 摆 放 ,因此 人 们 可 以 在 大 脑 中 对 
同一 个 物体 进行 不 同 的 尺寸 或 距离 的 表征 ;“ 发 
现 ” 处 理 模 块 (FIND processing module), 该 模块 是 
在 短 时 记忆 中 搜索 某 个 特定 的 客体 或 其 部 分 的 属 
性 ,然后 将 该 信息 提供 给 “放置 ”处理 模块 进行 整 
合 。 由 此 可 知 ， 表象 的 生成 是 由 各 个 加 工 模 块根 
据 不 同 的 加 工 目 的 , 按 一 定 原则 组 合 进行 表征 完 
成 的 ， 其 中 每 个 模块 都 可 以 看 作 是 独立 的 加 工 单 
元 并 且 负 责 一 种 计算 过 程 。 

值得 注意 的 是 ,构建 图 像 的 数据 是 以 深层 表 
征 的 形式 存储 在 长 时 记忆 中 , 但 它 无 法 直接 在 人 
们 的 意识 中 显示 ， 而 是 需要 载体 的 支持 ， 即 类 似 
于 保存 在 计算 机 图 片 程 序 中 的 文件 ， 需 要 在 计算 
机 的 监视 器 屏幕 上 构建 出 可 视 化 图 像 。 视 觉 表 象 
同样 需要 在 一 个 叫做 “视觉 缓冲 器 (visual buffer)” 
的 结构 中 才能 得 到 显示 。 视 觉 缓冲 器 是 一 种 空间 
载体 ， 载 体 不 同 于 表征 ， 它 只 是 一 种 文 持 表征 的 
工作 和 平台， 而 表征 才 是 那些 需要 传递 的 信息 。 视 
觉 缓冲 器 类 似 于 一 个 坐标 空间 ， 上 面 是 由 许多 点 
构成 的 一 个 列 阵 。 如 图 2 所 示 ， 以 “车 ”作为 例子 ， 
个 体 在 生成 表象 时 ， 大 脑 选 择 性 激活 矩形 列 阵 
(array) 或 矩阵 中 的 单元 格 (cell), 使 人 产生 相应 的 
心理 表征 , 但 这 些 和 矩阵 并 不 是 简单 地 激活 或 未 激 
活 ， 它 们 包含 着 表示 该 点 图 像 的 特征 符号 ， 并 且 
具有 不 同 的 激活 水 平 。 因 此 ， 我们 认为 视觉 缓冲 
器 是 一 个 特殊 的 视觉 短 时 记忆 媒介 ， 能够 加 工 从 
长 时 记忆 中 被 提取 出 来 的 表征 信息 。 它 具有 描述 
各 种 空间 关系 的 能 力 ,可 以 以 矩阵 的 方式 模拟 一 
个 坐标 空间 ， 使 表象 得 以 呈现 。Pearson (2007) 通 
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图 2 “车 ”的 表征 信息 在 视觉 缓冲 器 中 以 矩阵 模型 形式 
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TE: A、B 与 C 代表 不 同 的 激活 水 平 。 


过 回顾 文献 也 提出 ， 人 们 会 有 意识 或 无 意识 地 直 


则 是 在 缺乏 外 界 刺激 的 条 件 下 ， 自 上 而 下 地 提取 
存储 在 记忆 中 的 信息 ,形成 心理 表征 。Shepard 和 
Metzler (1971) 以 二 维 、 三 维 图 形 以 及 立体 图 像 、 

字母 或 实物 作为 心理 旋转 研究 的 材料 ， 要求 被 试 
判断 镜像 材料 的 相似 与 差异 ， 为 视觉 表象 和 视 知 
觉 的 关系 提供 了 实验 证 据 。 他 通过 研究 人 们 在 大 
脑 中 操作 表象 的 方式 ， 发 现 表 象 表征 与 外 部 客体 
的 操作 是 平行 的 “二 级 同 构 ” 关 系 (second-order 
isomorphism)， 即 内 部 表征 的 功能 联系 类 似 于 外 


接 从 知觉 信息 中 或 长 时 记忆 中 提取 出 视觉 心理 图 
像 ， 然 后 在 视觉 缓冲 器 中 重新 构建 图 像 。 视 觉 组 


部 客体 的 结构 联系 。 这 种 同 构 关 系 印证 了 表象 的 
实质 在 于 它 是 一 种 类 比 表征 ,是 对 客观 视 知觉 的 
内 在 心理 映射 。 视 觉 表 象 和 视 知 觉 差 异 的 研究 最 


冲 器 的 特点 是 负责 信息 的 传递 ， 其 中 心 部 分 与 最 
高 分 辨 率 联系 相对 应 ,远离 中 心 分 状 率 降低 。 
1.2 ”视觉 表象 生成 与 视 知觉 生成 的 区 别 与 联系 
在 “表象 之 争 ” 中 许多 研究 者 将 视觉 表象 和 视 
知觉 联系 在 一 起 ， 认 为 视觉 表象 和 视 知 觉 具 有 相 
似 的 功能 结构 。 本 文通 过 探讨 二 者 之 间 的 区 别 与 
KR, RH: (1) 视觉 表象 与 视 知 觉 是 机 能 等 价 关 
R; (2) 视 觉 表 象 生成 机 制 是 一 个 相对 独立 的 成 分 。 
Paivio (1975b) 提 出 的 双重 编码 理论 (dual 
coding theory) 认 为 表象 是 存在 于 记忆 系统 中 的 一 
种 编码 或 者 表征 方式 ， 它 能 够 对 具体 的 客体 或 事 
件 的 信息 进行 编码 、 储 存 、 转 换 和 提取 ， 是 一 种 
类 似 知 觉 的 信息 表征 。 建 构 情 境 模 拟 理 论 
(constructive episodic simulation hypothesis) W 为 
视觉 表象 与 视 知觉 生成 过 程 共享 相似 的 加 工 机 制 
这 一 观点 提供 了 理论 依据 (Kosslyn，Ganis,& 
Thompson，2006)。 该 理论 指出 ， 记 忆 痕 迹 由 涉及 
对 事件 编码 的 皮质 区 的 分 布 式 神经 网 络 组 成 ， 这 
些 神 经 网 络 在 提取 中 被 重新 激活 ， 由 于 视觉 表象 
和 视 知 觉 在 神经 网 络 分 布 上 重 释 程度 较 高 ， 因 此 
& ee T Ht ik ic 1Z AY Fe AE (Schacter, Gaesser, & 
Addis, 2013)。 这 意味 着 在 生成 视觉 表象 和 视 知觉 
的 过 程 中 , 具有 相似 的 内 部 过 程 ,视觉 表象 的 生 
成 机 制 类 似 于 视 知觉 。 目 前, SEA fMRI 的 研究 也 
进一步 证 实 了 视觉 表象 是 以 图 画 式 内 在 表征 
(pictorial representation) 的 方式 存在 ,与 知觉 表征 


oo 


时 可 以 追溯 到 Behrmann, Moscovitch 和 Winocur 
(1994) 和 Servos 和 Goodale (1995) 的 失 认 症 病 人 表 
象 的 案例 ， 研 究 者 们 均 发 现 表 象 和 知觉 能 力 存在 
分 离 , 病人 虽然 无 法 知觉 物体 , 但 是 在 一 系列 测 
试 中 他 能 够 产生 完整 的 视觉 表象 。 相反 , Zeman 等 
人 (2010) 也 发 现 一 个 特殊 案例 , 在 没有 任何 视觉 
问题 的 情况 下 , 病人 失去 了 视觉 表象 能 力 。 可 见 ， 
表象 与 知觉 具有 相似 性 又 存在 着 差异 性 ,两 者 是 
机 能 等 价 关 系 ,但 是 视觉 表象 可 以 在 视 知 觉 缺 失 
的 条 件 下 生成 , 说 明 其 生成 机 制 在 大 脑 的 机 能 结 
构 中 是 一 个 相对 独立 的 成 分 。 

最 新 的 脑 成 像 研究 从 神经 机 制 的 角度 出 发 ， 
进一步 验证 了 视觉 表象 与 视 知 觉 之 间 存 在 着 相似 
与 差异 之 处 。Dijkstra, Bosch 和 van Gerven (2017) 
通过 呈现 面孔 、 字 母 和 水 果 的 图 片 ， 要求 被 试 根 
据 线索 进行 回忆 ,结果 发 现 被 试 生成 表象 的 清晰 
度 与 感知 觉 和 表象 机 制 的 重合 有 关 , 这 与 前 人 的 
理论 一 致 ， 即 工作 记忆 、 视 知觉 和 视觉 表象 在 视 
觉 区 域 中 存在 着 共同 的 神经 机 制 (Albers，Kok， 
Toni, Dijkerman, & de Lange, 2013; Bosch, Jehee, 
Fernandez, & Doeller, 2014; Lee, Kravitz, & Baker, 
2012), JF AIP AI RAE TIE EK 
域 ， 还 存在 于 顶 叶 (parietal area). 、 前 运动 区 
(premotor area) 以 及 额 叶 区 (frontal area); 然而 ， 
Dijkstra, Zeidman, Ondobaka, van Gerven 和 Friston 
(2017) 通 过 检验 有 效 连 接 (effective connectivity) 的 


方式 联系 密切 ， 并且 二 者 共同 激活 的 脑 区 存在 较 
KEA (Pearson & Kosslyn, 2015). 

虽然 视觉 表象 与 视 知 觉 在 表征 方式 和 加 工 机 
制 上 相似 , 但 视觉 表象 并 不 等 同 于 视 知觉 。 知 觉 
是 将 接收 到 的 外 界 信息 编码 为 神经 表征 ， 而 表象 


变化 ,揭示 了 知觉 和 表象 自 下 而 上 和 自 上 而 下 的 
耦合 连接 存在 的 差异 。 研 究 者 发 现在 产生 感知 觉 
的 阶段 ， 自 上 而 下 和 自 下 而 上 的 耦合 强度 相对 于 
基线 水 平 都 得 到 提高 。 相反, 在 生成 表象 期 间 ， 只 
有 自 上 而 下 的 耦合 增强 ,并 且 这 种 增强 的 程度 远 
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远大 于 感知 觉 过 程 的 。 对 于 感知 觉 来 说 ， 自 下 而 
上 和 自 上 而 下 的 耦合 构成 了 对 视觉 经 验 的 基础 ， 
而 对 于 表象 来 说 , 虽然 缺失 自 下 而 上 的 驱动 , 但 
是 自 上 而 下 的 耦合 会 伴随 着 视觉 经 验 增强 。 由 此 
可 见 ,， 表象 生成 与 感知 觉 生成 的 脑 机 制 既 有 相似 
重 闪 之 处 ,也 存在 着 差异 。 


2 视觉 表象 生成 系统 的 神经 基础 

脑 功能 成 像 技 术 的 运用 为 我 们 认识 视觉 表象 
生成 的 神经 机 制 提供 了 途径 , 同时 也 为 我 们 探索 
视觉 表象 生成 系统 的 神经 基础 提供 了 可 能 。 


aa 


位 于 Brodmann 17 区 的 V1 区 是 接收 视觉 信号 
的 第 一 个 皮层 区 域 , 也 是 与 视觉 表象 的 生成 有 着 
最 密切 联系 的 区 域 。 因 此 ,关于 表象 生成 的 很 多 
人 研究 基本 围绕 V1 区 展开 (Bridge, Harrold, Holmes, 
Stokes, & Kennard, 2012; Roelfsema & de Lange, 
2016)。 

当 我 们 看 到 一 个 新 的 物体 时 ,大脑 皮层 对 其 
的 加 工 处 理会 经 历 不 同 的 阶段 。 首 先是 将 信息 从 
丘脑 的 外 侧 膝 状 核 (lateral geniculate nucleus) 传 递 
到 V1 区 , 然后 再 传递 到 更 高 级 的 视觉 区 域 (Pearson 


精确 性 、 强 度 等 方面 存在 差异 。 造 成 这 种 差异 的 
关键 ,可 能 是 由 于 早期 的 视觉 区 域 , 特别 是 V1 区 
的 作用 ， 因 为 正 是 这 个 区 域 编码 了 与 这 些 心理 表 
象 特征 相关 的 高 分 辩 率 细节 ， 即 具体 视觉 特征 的 
信息 。 近 期 的 研究 已 经 证 实 了 这 个 假设 , 研究 者 
通过 将 视觉 刺激 转换 为 底层 视觉 特征 (如 位 置 、 空 
间 频 率 、 朝 向 ) 进 行 描述 ， 并 使 用 刺激 特征 模式 来 
预测 大 脑 的 激活 ， 从 而 建立 了 视觉 刺激 内 容 和 大 
脑 响应 模式 之 间 的 函数 关系 。 这 个 基于 底层 视觉 
特征 的 编码 模型 可 以 根据 被 试 生成 表象 时 V1 区 
的 神经 活动 从 上 千张 随意 挑选 的 图 片 中 选择 出 
被 试 在 大 脑 中 想象 的 图 片 (Naselaris et al., 2015)。 
该 结果 直接 证 明了 生成 表象 时 , V1 区 表征 了 具体 
的 底层 视觉 特征 信息 。 另 一 方面 , 研究 尝试 将 表 
象 过 程 中 的 个 体 差 异 和 解剖 学 上 的 差异 联系 起 来 ， 
发 现 V1 区 面积 越 大 ,空间 定位 能 力 越 高 、 上 下 文 
诱发 产生 假象 的 能 力 越 弱 .敏感 度 越 低 (Schwarzkopf 
& Rees, 2013)。 因 而 , V1 区 表面 积 越 大 ， 视 觉 精准 
ERE Bergmann, Genç, Kohler, Singer 和 Pearson 
(2016) 首 次 借助 fMRI 视网膜 皮层 映射 技术 研究 表 
象 强度 、 精 确 性 与 V1 区 之 间 的 关系 。 结 果 发 现 


& Kosslyn, 2015)。 那 么 在 这 期 间 , V1 区 到 底 起 着 
怎样 的 作用 呢 ? 根据 知觉 预期 理论 (perceptual 
anticipation theory)， 当 人 们 强烈 地 预期 自己 能 够 
感知 一 件 事物 或 者 一 个 场景 时 , 会 在 V1 区 中 构 
建 出 关于 这 个 刺激 的 图 画 式 表征 (Kosslyn & 
Thompson，2003)。 按 照 这 一 理论 ,关于 图 像 形 状 
的 视觉 长 时 记忆 以 抽象 代码 的 形式 存储 于 下 里 叶 
(inferior temporal lobe), “4 V1 区 被 激活 的 时 候 ， 
言 息 会 被 重新 提出 进行 处 理 。Kosslyn AW, RA 
生成 不 是 简单 的 存 贮 信息 的 “内 回 ” 而 是 一 个 重 
新 构建 的 过 程 。 因 此 ， 要 重建 视觉 表征 ,首先 要 在 
V1 区 中 重新 组 织 建构 图 形 ， 这 说 明 V1 区 可 能 存 
在 一 个 神经 机 制 , 负责 表征 物体 或 者 场景 的 基本 
视觉 特征 ,才能 将 大 脑 中 的 信息 重新 整合 成 表象 
(Kosslyn & Thompson, 2003)。 而 Albers 等 人 (2013) 
的 研究 进一步 发 现 , V1 区 起 到 一 个 动态 的 “黑板 
(blackboard)” 的 作用 ， 用 于 人 处理 自 下 而 上 的 感知 


表象 强度 与 V1 区 表面 积 大 小 呈 负 相关 , B V1 区 
表面 积 越 小 就 越 可 能 产生 强 表象 ; 而 表象 精确 性 
和 V1 区 表面 积 大 小 呈正 相关 ， 其 中 V1 区 的 中 心 
部 分 和 精确 性 联系 最 为 密切 。V1 区 的 功能 与 我 们 
前 面 提 及 的 表象 计算 理论 中 视觉 缓冲 器 的 特点 相 
符合 ， 因 此 ,我们 推测 ,视觉 缓冲 器 的 神经 机 制 
最 有 可 能 存在 于 V1 区 。 

当前 表象 领域 的 研究 成 果 表 明 ,，V1 区 不 仅仅 
只 是 表征 具体 的 底层 视觉 特征 信息 (Kok, Failing, 
& de Lange，2014)， 它 还 参与 了 较 高 水 平 的 认 知 
加 工 。Naselaris 等 人 (2015) 的 研究 还 证 明了 ,被 试 
在 提取 长 时 记忆 中 的 复杂 场景 生成 表象 的 过 程 中 ， 
底层 视觉 特征 同样 得 到 编码 。 而 Roelfsema 和 de 
Lange (2016) 通 过 回顾 前 人 的 研究 ， 则 提出 了 V1 
区 可 作为 复杂 认 知 过 程 中 “多 尺度 认 知 黑板 
(multiscale cognitive blackboard)” 的 观点 。 人 研究 者 
通过 文本 分 离 、 视 觉 检 索 和 轮廓 分 组 等 实验 , 证 


刺激 和 自 上 而 下 生成 的 心理 表象 。 这 系列 的 研究 
证 实 了 V1 区 是 随后 一 系列 复杂 信息 加 工 的 入 口 
和 表象 生产 的 载体 。 

研究 者 发 现 表 象 生 成 过 程 中 的 加 工 差异 会 导 
致 个 体 在 表征 内 在 视觉 信息 的 时 候 ， 其 生动 性 、 


实 了 在 视觉 处 理 过 程 中 ， 较 高 级 视觉 皮层 脑 区 的 
处 理 需 可 以 通过 V1 区 将 中 间 计 算 过 程 写 入 较 低 
级 的 脑 区 ， 因 而 较 高 水 平 的 信息 可 以 在 较 低 级 的 
脑 区 中 被 读 取 出 来 进而 进行 后 续 的 加 工 ， 从 而 有 
效 地 交换 信息 。 可 见 ，V1 区 同样 参与 了 较 高 水 平 
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的 表象 过 程 ， 并 且 可 以 作为 大 脑 不 同 层级 结构 之 
间 信 息 转 换 的 枢纽 。 
除 V1 区 之 外 , 视觉 表象 生成 还 与 许多 脑 皮 


置 、 发 现 )。 不 同 的 因素 通过 影响 这 三 个 模块 的 操 
VE, 将 会 影响 表象 的 生成 。 在 探讨 表象 生成 理论 
和 神经 机 制 的 基础 上 ,我 们 讨论 表象 生成 的 影响 


层 网 络 有 关 ， 从 前 额 叶 区 域 到 顶 骨 、 显 叶 甚 至 
些 皮 层 下 区 。Ishai, Ungerleider 和 Haxby (2000) 
的 实验 要 求 被 试 在 感知 觉 和 表象 两 种 情况 下 生成 
关于 房屋 、 面 孔 和 椅子 的 图 像 ， 结 果 表 明 视 觉 表 
象 的 生成 系统 包括 了 外 纹 皮层 区 域 (extrastriate 
cortex) 以 及 顶 叶 皮层 (parietal cortex) 和 和 额 叶 皮 层 
(frontal cortex)。 外 纹 皮质 与 物体 类 别 (房屋 、 面 孔 
或 者 椅子 ) 相 关 , 但 激活 的 区 域 仅 限于 感知 觉 过 程 
中 激活 的 一 小 部 分 区 域 ; 而 感知 觉 中 没有 被 激活 
的 项 叶 和 有 额 叶 皮 层 ， 则 在 表象 中 被 激活 ， 主 要 负 
责 协 调 从 长 时 记忆 中 提取 面部 和 物体 表征 的 过 程 ， 
但 它们 的 激活 与 物体 类 别 无 关 。 后 续 的 研究 也 表 
明了 外 纹 皮 层 区 域 和 额 叶 在 视觉 感知 和 表象 的 类 
别 选择 中 起 着 重要 作用 。 在 视觉 感知 的 过 程 中 ， 
外 纹 皮层 的 类 别 选择 模式 是 通过 与 早期 视觉 区 域 
的 顺 向 连接 来 调节 的 ; 与 此 相反 , 在 视觉 表象 中 ， 
类 别 选择 的 激活 是 由 前 额 叶 皮层 逆向 连接 来 调节 
的 (Mechelli, Price, Friston, & Ishai, 2004)。2002 年 ， 
Ishai, Haxby 和 Ungerleider 设计 了 另 一 个 实验 , 通 
过 要 求 被 试 回忆 熟悉 的 名 人 面孔 ,定位 产生 视觉 
感知 时 被 激活 的 区 域 ， 进 一 步 比 较 长 时 记忆 和 短 
时 记忆 情况 下 产生 视觉 表象 的 差异 。 研 究 结 果 与 
之 前 的 实验 一 致 ， 被 试 在 感知 名 人 面孔 的 时 候 ， 
枕 下 回 (inferior occipital gyrus)、 侧 梭 状 回 (lateral 
fusiform gyrus), _/#iY4(superior temporal sulcus) 
和 杏仁 体 (amygdala) 被 激活 ， 而 表象 生成 激活 的 
区 域 则 包含 在 这 些 区 域内 。 除 此 之 外 ,被 试 形成 
关于 名 人 面孔 的 表象 时 ,还 激活 了 双 侧 距 状 裂 
(bilateral calcarine) 、 海 马 体 (hippocampus) AI 
叶 (precuneus)、 顶 内 沟 (intraparietal sulcus) 和 额 下 
回 (inferior frontal gyrus), PRATIT ERZEN 
过 程 中 负责 选择 相关 细节 的 重要 区 域 ， 因 为 细节 
经 验 的 丰满 程度 有 利于 产生 生动 的 表象 (Ganis， 
Thompson, & Kosslyn, 2004)。 由 此 可 见 ， 这 些 不 
同 的 大 脑 区 域 在 视觉 表象 生成 中 也 发 挥 着 重要 的 
作用 。 


3 ”表象 生成 的 影响 因素 


Kosslyn (1980) 提 出 的 表象 计算 理论 认为 表 
象 生 成 过 程 涉及 三 个 复杂 的 处 理 模块 (图 示 、 放 


因素 有 助 于 进一步 深入 了 解 表象 生成 的 实质 。 
3.1 影响 “图 示 ” 处 理 模 块 的 因素 
“图 示 ” 处 理 模 块 是 将 储存 在 长 时 记忆 中 的 深 
层 表征 转化 为 短 时 工作 记忆 中 的 表层 表征 ， 因 此 
涉及 到 记忆 信息 的 提取 与 操作 。Albers 等 人 (2013) 
发 现 V1 区 的 神经 活动 模式 可 以 同时 解码 工作 记 
忆 和 表象 过 程 。 他 使 用 多 变量 模式 分 析 方 法 
(multivariable analysis) 直 接 比较 工作 记忆 和 心理 
表象 中 的 神经 表征 方式 ， 观察 到 被 试 在 维持 视觉 
材料 (工作 记忆 ) 的 期 间 和 内 部 生成 视觉 刺激 (心理 
表象 ) 的 期 间 , 大 脑 产生 类 似 的 神经 活动 。 另 外 ， 
Albers 等 人 的 实验 要 求 一 部 分 被 试 在 短 时 工作 记 
忆 任 务 中 大 脑 始终 保持 定向 光栅 的 图 案 ， 直到 探 
针 刺 激 出 现 ; 而 另 一 些 被 试 根据 给 定 的 提示 ,在 
脑海 中 形成 相同 的 光栅 的 视觉 表象 ， 并且 进行 心 
理 旋转 操作 。 该 研究 发 现 ， 基 于 短 时 工作 记忆 条 
件 下 V1 区 的 活动 模式 构建 的 分 类 器 也 能 够 精确 
地 解码 视觉 表象 ， 说 明 表 象 过 程 与 工作 记忆 存在 
神经 机 制 和 功能 机 制 的 重生 ,产生 于 长 时 记忆 信 
息 之 中 的 视觉 表象 也 同样 具有 和 暂时 性 和 直觉 性 。 
回顾 前 人 对 工作 记忆 和 心理 表象 两 者 关系 的 研究 ， 
研究 者 也 从 不 同 角 度 证 实 了 工作 记忆 对 表象 生成 
结果 的 影响 如 Zvyagintsev 等 人 (2013) 提 出 表象 
清晰 度 取决 于 工作 记忆 系统 ,破坏 工作 记忆 中 的 
视觉 空间 模板 会 明显 破坏 视觉 表象 清晰 度 。 而 
Baddeley 和 Andrade (2000) 阅 述 了 工作 记忆 中 的 
中 央 执 行 系统 在 表象 中 的 调控 作用 ,以 及 任务 负 
载 对 视觉 表象 的 抑制 作用 -Gunter 和 Bodner (2008) 
提出 生动 回忆 与 中 央 执 行 系统 资源 有 关 ， 中 央 执 
行 系统 负载 越 多 ,表象 受 损 越 严 重 。 可见 ， 短 时 工 
作 记 忆 与 视觉 表象 密切 相关 ,并且 影响 视觉 表象 
的 生成 结果 。 
3.2 ”影响 “放置 ?处理 模块 的 因素 

“放置 ?处 理 模块 是 将 搜索 出 的 信息 进行 重 置 ， 
使 客体 或 者 其 部 分 元 素 处 于 表象 中 的 正确 位 置 
上 。1982 4F, Ungerleider 首次 提出 大 脑 存在 腹 侧 
视觉 通路 (ventral visual pathway) $H EF AM XI iE M 
(dorsal visual pathway) 两 条 视觉 加 工 通路 ， 其 
腹 侧 视觉 通路 主要 负责 客体 的 轮廓 与 辨别 ， 而 背 
侧 视 觉 通路 则 负责 处 理 空间 信息 的 加 工 。 因 而 ， 
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个 体 在 放置 客体 视觉 表征 信息 (物体 的 轮廓 、 尺 
T HE .亮度 等 ) 和 空间 视觉 表征 信息 (空间 位 置 、 
运动 方向 等 ) 的 过 程 中 存在 差异 。 随 着 表象 表征 研 
究 的 深入 ，Kozhevnikov、Kosslyn 和 Shephard 
(2005) 指 出 个 体 的 表象 风格 可 分 为 两 种 不 同 的 类 
型 ， 即 客体 表象 型 (object imagery style) 和 空间 表 
象 型 (spatial imagery style)。 前 者 擅长 建构 客体 图 
像 的 高 分 辩 率 细节 ,他 们 在 识别 退化 图 形 (degraded 
pictures) 等 客体 视觉 细节 任务 中 表现 较 好 ,但 在 
空间 表象 任务 (如 心理 旋转 ) 中 的 成 绩 却 低 于 平均 
ACE; 后 者 擅 于 使 用 表象 来 表征 空间 关系 , 在 复 
要 的 空间 转换 任务 中 表现 优秀 , 但 在 客体 表象 任 
务 中 的 成 绩 却 较 差 .Blazhenkova (2016) 使 用 VOSI 
和 VVIQ 测量 方法 支持 了 这 个 结论 ,他 要 求 111 
名 学 生 完 成 对 9 项 客体 和 9 项 空间 项 目的 表象 清 
晰 度 的 自我 评估 , 并且 评价 他 们 在 艺术 和 科学 能 
力 水 平 上 的 高 低 。 实 验 结果 支持 生成 表象 的 清晰 
度 受 两 个 维度 的 影响 : 客体 (颜色 、 纹 理 或 形状 ) 
和 空间 (三 维 结构 、 位 置 和 结构 )。 客 体 清晰 度 项 目 
与 艺术 能 力 评级 呈正 相关 ， 而 空间 清晰 度 项 目 与 
科学 能 力 评 级 呈正 相关 。 
3.3” 影响“ 发现” 处 理 模 块 的 因素 

某 个 特定 的 客体 或 其 部 分 元 素 在 短 时 工作 记 
忆 中 被 搜索 ， 即 “发 现 ” 处 理 模块 ,而 注意 则 是 参与 
搜索 过 程 的 一 种 自 上 而 下 的 机 制 ， 它 允许 个 体 有 
选择 地 检索 客体 或 场景 中 的 目标 特征 并 且 会 对 随 
后 的 任务 执行 造成 影响 。 注 意 可 以 动态 地 调节 工 
作 记 忆 的 内 容 ， 以 保证 优先 检索 与 当前 任务 相关 
的 内 在 表征 。 过 人 往 的 研究 发 现 ， 当 人 们 处 于 情绪 
低落 的 状态 时 ， 他 们 很 难 对 未 来 或 者 过 去 的 事件 
产生 生动 的 正 癌 表象 ,这 是 由 于 消极 情绪 会 损坏 
注意 系统 的 控制 能 力 ， 从 而 影响 注意 力 分 配 , F 
扰 了 个 体 搜索 表象 的 能 力 (Hirsch & Mathews, 
2012)。 对 于 该 结论 , 我 们 回顾 了 Hishitani, Miyazaki 
和 Motoyama (2011) 的 假设 ， 他 们 认为 个 体 生 成 正 
向 的 表象 比 生 成 负 向 的 表象 生动 , 可 能 是 由 于 在 
注意 过 程 中 , 大 脑 中 存在 一 种 可 以 调控 视觉 表象 
中 信息 量 的 反应 机 制 , 在 生成 正 向 表象 的 时 候 它 
会 分 配 较 多 的 信息 资源 ， 而 这 种 机 制 会 抑制 负 向 
表象 的 产生 ， 形 成 模糊 的 表象 。Motoyama 和 
Hishitani (2016) 的 研究 进一步 证 实 了 大 脑 中 确实 
存在 这 种 抑制 机 制 ， 它 位 于 左 侧 扣 带 后 回 区 域 
(left posterior cingulate gyrus)， 当 个 体 产生 负 向 表 


象 时 ， 左 侧 扣 带 后 回 区 域 被 激活 ， 激 活水 平 与 生 
成 表象 的 主观 清晰 度 呈 反比， 该 区 域 的 发 现 与 前 
人 提 到 的 研究 结果 一 致 ， 即 注意 任务 在 枢 前 叶 、 
前 扣 带 回 、 左 侧 扣 带 后 回 等 区 域 都 得 到 激活 
(Tomasi, Ernst, Caparelli, & Chang, 2006), 可 见 大 
脑 左 侧 扣 带 后 回 可 能 是 注意 抑制 机 制 存在 的 
域 。 因 此 , 我 们 认为 , 在 表象 的 过 程 中 , 注意 会 通过 
影响 认 知 信息 资源 的 分 配 , 促进 或 者 抑制 我 们 表象 
生成 中 的 “发 现 ” 处 理 模 块 进而 影响 表象 的 结果 。 
3.4 ”影响 表象 生成 过 程 的 其 他 因素 

除了 上 述 认 知 加 工 过 程 会 影响 表象 生成 之 外 ， 
一 些 个 体 特质 (如 年 龄 .性别 和 生理 激素 等 ) 也 会 使 
得 表象 生成 存在 差异 。 

Raz, Briggs, Marks 和 Acker (1999) 发 现年 龄 
会 影响 表象 生成 和 表象 操作 两 种 心理 表象 过 程 。 
Kemps 和 Newson (2005) 的 研究 表明 ， 对 于 不 同 的 
心理 表象 ， 其 精确 度 也 会 随 着 年 龄 的 增加 而 降 
低 。 然 而 , 在 之 前 的 研究 中 没有 考虑 到 性 别 和 年 
龄 之 间 可 能 会 存在 交互 作用 ， 比 如 曾经 有 研究 者 
通过 心理 旋转 实验 ,发 现 男 性 存在 明显 优势 (Verde 
et al., 2013)。 因 此 , Palermo, Piccardi, Nori, Giusberti 
和 Guariglia (2016) 提 出 性 别 差异 可 以 解释 前 人 研 
究 结 果 的 部 分 原因 ， 他 将 年 龄 和 性 别 因素 同时 纳 
入 到 影响 表象 生成 的 因素 中 ,并 使 用 CVMIB 量 
表 (complete visual mental imagery battery) 来 验证 
假设 , 结果 发 现 除了 表象 维持 过 程 ， 表象 生成 过 
程 、 检 验 过 程 、 转 换 过 程 都 受到 年 龄 的 影响 ， 这 
可 能 是 由 于 背 外 侧 前 额 皮质 的 体积 随 着 年 龄 的 
加 而 减 小 (Raz et al., 1999), 所 以 以 上 的 加 工 过 程 
也 受到 了 影响 。 另 外 , 虽然 在 该 表象 旋转 任务 中 ， 
男性 的 表现 优 于 女性 , 但 研究 并 没有 发 现 性 别 会 
影响 表象 生成 的 过 程 。 

生理 激素 与 性 别 有 密 切 关联 。Wassell, Rogers, 
Felmingam, Bryant 和 Pearson (2015) 采 用 客观 测量 
双眼 竞争 的 方法 和 主观 问卷 调查 来 评估 表象 ， 发 
现 荷 尔 蒙 的 浓度 可 以 用 来 预测 视觉 表象 的 强度 和 
清晰 度 。 和 荷尔蒙 调节 是 自 上 而 下 的 自发 调节 ， 而 
黄体 酮 作为 一 种 女性 荷尔蒙 直接 影响 女性 生成 表 
象 的 清晰 度 ， 处 于 黄体 期 中 期 的 女性 比 卵泡 期 后 
期 的 女性 以 及 男性 具有 更 强 和 更 生动 的 心理 表 
象 。 遭 受到 创伤 性 事件 后 ， 处 于 黄体 期 的 女性 产 
生 更 强烈 的 侵入 性 表象 (Ferree, Kamat, & Cahill, 
2011), 而 且 比 起 处 于 其 他 阶段 的 月 经 周期 的 女性 ， 
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黄体 期 的 女性 对 情感 激烈 事件 的 记忆 更 深刻 
(Canli, Desmond, Zhao, & Gabrieli, 2002)， 这 是 由 
于 相 比 于 其 他 阶段 ， 处 于 黄体 期 中 期 的 女性 注意 
力 水 平 增高 ， 而 注意 力 与 内 源 性 黄体 酮 水 平 有 关 
(Solis-Ortiz & Corsi-Cabrera, 2008)。 认 知 资源 的 集 
中 可 以 促进 有 意识 表象 的 生成 和 维持 ， 从 而 导致 
表象 清晰 度 提高 。 激 素 浓度 变化 ， 是 造成 视觉 表 
象 的 个 体 动态 差异 的 部 分 生理 基础 。 


4 ”存在 的 问题 与 展望 
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本 综述 从 理论 依据 和 神经 机 制 的 角度 阐述 了 
视觉 表象 的 生成 系统 及 其 影响 因素 。 研 究 证 实 表 


ea a a eet 
合作 更 是 生成 过 程 中 不 可 或 缺 的 环节 。 由 此 可 以 
看 出 ,未 来 的 研究 需 进 一 步 深入 探讨 和 补充 相关 
内 容 : 
41 视 知 党 和 视觉 表象 的 分 离 

尽管 前 人 研究 证 实 知觉 和 表象 在 功能 上 存在 
分 离 , 但 两 者 在 解剖 结构 上 存在 重合 。 外 界 刺激 
影响 知觉 生成 的 同时 是 否 会 影响 表象 ? 如 果 有 影 
响 ， 那 影响 程度 如 何 ? 影响 是 相互 促进 的 还 是 相 
互 抑制 的 ? 目前 , 大 多 数 研究 仍然 很 难 将 表象 从 

觉 中 完全 抽 离 出 来 , 因此 ,我们 可 以 进一步 研 
pein sels 
42 ”对 其 他 感官 表象 的 讨论 

本 综述 重点 关注 表象 的 视觉 品质 ， 强 调 视觉 
表象 的 生成 机 制 ， 并 未 对 其 他 感官 表象 (如 听觉 表 
象 、 触 觉 表 象 等 ) 进 行 讨论 。 我 们 在 日 常生 活 中 离 
不 开 其 他 感官 表象 的 作用 ， 如 听觉 表象 能 够 帮助 
记忆 ， 触觉 表 象 在 脉 诊 实践 中 发 挥 重要 作用 等 。 
因此 ,后续 人 研究 应 结合 多 种 感官 表象 ， 进 一 步 探 
讨 影响 表象 生成 的 机 制 。 
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The system of visual imagery generation and its effect factors 


LIN Yuting; ZHANG Delong; LIU Ming 
(School of Psychology, South China Normal University, Guangzhou 510631, China) 


Abstract: Visual mental imagery is defined as the representation of visual information in human brain 


without external sensory stimuli, which plays an essential role in most of human’s mental activities. In this 


paper, we reviewed a theoretical computational model of visual mental imagery and summarized the 


essential components of visual imagery generation system with its corresponding neural basis. This paper 


highlights that the great importance of primary visual cortex in visual imagery process as it works as a 


“visual buffer” for generating visual information mentally. Factors that affect the production of visual 


mental imagery were also outlined. By offering a comprehensive understanding model of the processing of 


visual mental imagery, this paper may facilitate the further researches on visual mental imagery. 


Key words: visual imagery; generation system; visual buffer; computational theory; neural mechanisms 


